フィールドとチャートのタイプ〜生成されたフィールドについて理解する #tableau
はじめに
お早うございます。大阪オフィス唯一のDI部メンバー、tamaでございます。
本エントリは、Tableau Desktop Qualified Associateの試験ガイド「評価するスキル」に関連する内容となります。
本エントリの概要
今回は「生成されたフィールドについて理解する」ということで、今一度原点(?)に帰る感じで、Tableauで必ず見ることになるフィールドについて見ていきたいと思います。
※今回の内容は、「連続と不連続」について、ある程度理解しておく必要があります。連続と不連続についてのエントリはこちらからどうぞ。
そもそも「フィールド」とは?
Tableauはマニュアルを熟読しなくても、ある程度個人の感覚のみで操作できてしまう部分があるので、いちいちTableauのどの部分が何という名称なのか把握していないユーザーもいると思います。
で、実際のところフィールドって何よ?って話なのですが、下記画像をご覧ください。
上記の赤枠で囲っているものがフィールドとなります。要するにTableauでいつも操作している「データの項目」ですね。これを(データ)フィールドと呼称します。
もう少し具体的に…
Tableauからデータソースに接続したとき、下記のような画面が表示されると思います。(データソース画面)
この画像の赤枠で囲っているところは、データのカラム(列)ですが、このカラムそれぞれがフィールドとして生成されます。生成されると同時に、そのカラムのデータ型(数値型とか文字列型とか)や役割(不連続or連続、メジャーorディメンション)が自動的に設定されます。
2つのフィールドの種類
メジャー
メジャーとは、基本的に数値とか量を表すデータを指します。分かりやすく言うと、何らかの集計(合計、平均など)を行うことができるデータがメジャーとなります。
ディメンション
ディメンションとは、文字列や定性的な数値を表すデータを指します。メジャーの逆…という言い方は正確ではないかもしれませんが、集計できないデータと考えると分かりやすいかもしれません。基本的には文字列データであることが多いですが、数値の場合もあります(顧客IDなど)。
ディメンションの主な役割としては、メジャーを分割することです。売上や利益といったメジャーに、ディメンションを加えることで、「地域別の平均売上」「顧客区分別利益」といったビューを可視化することができます。
青色と緑色の違い
ここまで見てみると、「ああ、緑色のフィールドがメジャーで、青色のフィールドがディメンションなんだな」と思いがちですが、実はそうではありません。フィールドにはもう一つの役割が付与されています。それは下記の通りです。
- 緑色:連続
- 青色:不連続
※連続と不連続についてはこちらのエントリもご覧ください。
上記のような誤解をしがちなのは、メジャーとディメンションの特性上、メジャーは連続に、ディメンションは不連続になりがちだからです。「なりがち」というだけであって、逆もあり得ます。
連続フィールド
「連続」フィールドをビューにドラッグすると、以下のようになります。
「連続」フィールドを行及び列に配置すると、「軸」が表示されます。ここでいう軸とは、その連続したデータの最小値から最大値までを表す指標のようなものです(現実世界でいう定規みたいな感じ)。
ちなみに、軸はフィールド毎に作成されます。ですので、列に連続フィールドを2つ配置すると以下のようになります。
列と行に複数配置すると、以下のようになります。(自動的に散布図になります)
不連続フィールド
「不連続」フィールドをビューにドラッグすると、以下のようになります。
「不連続」フィールドを行及び列に配置すると、「ヘッダー」が表示されます。ヘッダーは基本的にそのままの意味で、連なっていない不連続のデータ毎に列が表示される…という感じです。
列と行に複数配置すると、以下のようになります。
配置した不連続フィールドに応じて、ヘッダーが入れ子になります。
フィールドについて把握しておくと便利
ここまで、フィールドの役割による可視化の違いについて見てきましたが、これらを抑えておくと、Tableauで色々なVizを作成するにあたり、作業をよりスムーズに運ぶことができます。
例えば、Excelのような、テキストのみのクロス集計表が作成したい場合、まずはボンヤリとクロス集計表を思い浮かべてみます。すると、必要なのは「ヘッダー」だけであって、「軸」はいらないことがわかります。ここまでわかれば、「不連続フィールドを行列に配置すればいい」というところまで分かるので、後はそれに沿って作業をすれば、すぐにビューは作成されるでしょう。
また、散布図の場合は、「縦と横にそれぞれ軸が必要」ということがわかるので、列と行にそれぞれ連続フィールドが必要…という風に作業レベルに変換することができます。
フィールドの役割について把握しておくと、Tableauで行う作業が、より分かりやすくなります。
おわりに
今回はフィールドについて見てきました。列や行だけでなく、フィルターやマークシェルフに配置する時も、フィールドの役割によって動作が変わってきますので、色々試してみて下さい。